词向量相关论文
本文介绍了文本分类的发展历史和文本预处理的方法,并通过构建卷积神经网络模型和循环神经网络模型,对预处理后的影像报告进行文本分......
军事需求文档产生于军事项目的开展过程中,用于阐述军事项目本身的目的、要实现的功能等。对军事需求文档进行术语识别和一致性检......
语义通信系统是目前通信领域的研究热点,但是该领域尚未建立起成熟的评价体系,导致不同性能度量指标下设计的语义通信系统的性能也各......
酒店顾客满意度作为一项重要指标,是顾客决策与酒店管理行为的重要依据。本文对酒店预订平台的在线评论进行情感分析获取顾客满意度......
为提高教评文本情感分析的准确率和适用性,提出一种利用改进Bi-LSTM结合Word2Vec的评教文本情感分析方法。采用词向量(Word2Vec)方式......
经典的文本鲁棒水印会修改文本内容或格式,从而降低文本的保真性和可用性,文章提出了一种基于Word2Vec的中文文本零水印算法,能够在不......
近年来,预训练模型在自然语言处理领域蓬勃发展,旨在对自然语言隐含的知识进行建模和表示,但主流预训练模型大多针对英文领域。中文领......
随着信息技术的迅速发展,人们的生活、学习和互联网已密不可分,尤其是作为新一代大学生的00后青年,经常在微博、微信和QQ等各种互联网......
深度学习方法的提出使得机器学习研究领域得到了巨大突破,但是却需要大量的人工标注数据来辅助完成.在实际问题中,受限于人力成本,......
直播作为一项新兴娱乐模式,越来越受到用户的欢迎。随着直播的发展与普及,大量实时的直播在线评论——弹幕随之产生。这些弹幕不仅......
互联网高速发展的同时伴随着日益严峻的网络攻击问题,包括网络钓鱼、垃圾邮件、恶意软件以及拒绝服务等。恶意URL(Uniform Resource......
由于中文短文本存在特征词少、规范性差、数据规模量大等难点,ERNIE预训练模型占用内存大,进行短文本分类时会造成向量空间稀疏、文......
传统的文本关键词提取方法忽略了上下文语义信息,不能解决一词多义问题,提取效果并不理想。基于LDA和BERT模型,文中提出LDA-BERT-Ligh......
统计机器翻译系统由规模较大、领域混杂的平行语料训练获得,当训练数据和测试数据领域分布不一致时,其翻译质量往往较低。针对这一......
近年来,人们对信息服务的要求由简单的信息获取转变为知识获取,知识图谱的快速发展为此提供了诸多便利。但通用知识图谱在应用于特......
随着互联网的快速发展,网络已经成为人们日常生活中重要的一部分。而智能手机等智能终端设备的出现,使得移动端成为互联网的重要接......
随着软件开发需求的不断增加,可复用软件代码的种类日益增多、规模日益增大,如何帮助软件开发人员为当前编程任务快速、准确地找到......
电子邮件已经成为人们生活和工作中必不可少的交流媒介,在现阶段人们的生活和工作中发挥着不可或缺的作用。电子邮件在带来便利的......
语言处在不断变化发展的过程中,其多个层面均可发生改变,如语音变化、音位变化、语义变化和句法变化。其中,最常见的语言变化应当......
核小体作为真核生物中染色质的基本结构单位,不仅压缩了染色质形态结构,在基因组表达、DNA复制和修复等生命阶段也起着关键作用。......
随着人工智能、互联网技术的应用,网络教育实现飞跃发展。目前,网络教育考试系统中对于选择题、填空题等客观问题可以做到准确的自......
微博、微信等网络社交媒体的兴起标志着自媒体时代的到来,自媒体新闻有着广阔的传播覆盖面,对自媒体新闻进行情感分析有利于了解社......
随着商标数据的爆炸式增长,国内外发生的商标近似侵权案件越来越多,如何从海量商标数据中准确地检索出近似商标,从而辅助用户对商......
随着国内金融市场的不断发展,参与金融市场投资的投资者也在逐年增加。投资者参与金融市场的主要方法为股票交易,但由于股票价格具......
借助于互联网新媒体传播的信息为人们的日常生活以及社会经济活动、企业组织决策、政府公共管理等提供了海量的信息来源和极大的便......
因果复句是汉语中应用最广泛,使用最频繁的复句,是汉语复句研究中不可缺少的一个重要部分。复句的研究首先是要理解复句的语义,这......
文档与查询之间的语义鸿沟是信息检索领域中一个挑战性的难题。伪相关反馈是解决这个问题的一个可行的办法。由于自然语言的复杂性......
随着信息技术的迅速发展,网络中产生了海量的中文短文本数据.利用中文短文本分类技术,在低信息量的数据中挖掘出有价值的信息是当......
句法分析作为自然语言处理中的重点与难点问题,一直广受关注。而组块分析作为浅层句法分析的重要一环,降低了完全句法分析的任务难......
基于深度神经网络(DNN)的OCR技术目前已能够在较为规范的数据集上取得较高的准确率。但是,当应用于真实场景时,图片重要信息丢失、图......
个人特征是用来衡量行为,思想和情感的习惯性模式。它因人而异,并且随着时间的推移在不同的情景下保持相对稳定。个人特征具有重要......
随着当前互联网环境中各类社交媒体的快速发展,人们在互联网上留下了海量的电子足迹信息,这些信息包含了人们的社会言论、社会关系......
随着信息技术的飞速发展与互联网的普及,网络用户更加热衷于在互联网上发表自己的观点、态度,各类网络平台上积蓄着用户大量的评论......
自人工智能技术发展以来,各领域都在寻找有利的结合点,最近几年,人工智能技术也不断涌现出与医疗领域结合的趋势,同时大量的数据资......
Ⅲ型分泌效应蛋白(T3SE)是革兰氏阴性细菌在其生长和繁殖中必不可少的蛋白质之一。革兰氏阴性细菌的致病机理依赖于T3SE,通过将T3SE......
近年来,随着自然语言处理技术的快速发展,聚焦于词级、短语级的研究已取得显著进展,针对于句子级的语义分析任务还相对较少,因此侧......
随着科学技术的喷涌式发展和智能移动终端的广泛普及,互联网行业来到了一个飞速发展的黄金时代。在人们日常产生的海量短文本信息......
当下,以微博为代表的各大社交网络平台逐渐成为了人们社会生活中不可或缺的一部分,用户在社交网络中进行交流、发表言论的交互式过......
[目的]本文提出一种基于集成策略的中文专利摘要生成模型(STNLTP),以改善现有的自动文本摘要技术在处理长文档摘要生成时存在的生成重......
国家审计的数据基础和审计方式随着大数据的发展而发生改变,其中文本分析技术逐渐深入应用到审计工作中.由于审计行业的领域专业性......
随着计算机视觉和自然语言处理的日益发展,视觉问答也发展为计算机科学领域的一个重要研究方向.视觉问答需要跨模态的理解与推理能......
随着互联网技术的快速发展,每天都会产生海量的文本数据。文本分类作为自然语言处理和网络信息挖掘的基础,在文本信息处理中有着重......
学位